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® Synthetlsche DNA-Kassetten mlt Kodlerung fuer artif felelle P rote I no und deren Expression. 

© Beschrieben wird die Herstellung volfsynthetischer Proteine. deren AminosSuresequenz unter Beachtung 
medizinlscher Oder emShrungsphysiotoglscher Gesichtspunkte genau dem jeweiligen Elnsatzgebfet angepaflt ist. 
auf gentechnotogischem Wege. Ausgegengen wird hierbei von das herzustellende Protein vollst&ndig oder 
teilweise codierenden DNA-Sequenzen (sog. Kassetten), die alleine oder in belieblger Kombinatlon *ktoren, 
z. B. Plasmide. integriert und in dieser Form In geeignete Wlrte. z. B. Prokaryonten oder Euka viten ein- 
schlleBlich Pflanzen. transformiert werden. Die erhaltenen Wirt-Vektor-Syateme expremieren das jewellige 
Protein. Die Kassetten k6nnen auch mutagenisiert werden, d. h. bestfmmte CodewCrter nicht enthaiten. oder 
^oligomerisiert sein. Die Oligomerisierung ist beschrieben. 
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ArtjfjzteHe Proteine deflnlerter Ammosaurezuaamrnensetzung, Verfahren zu Ihrer Herstellung durch 
svnthettsche Nuctelnsauren sowle dabei verwendete DNA-Kassetten, Expresslonsvektoren und Wirt- 

Vektor-Systeme 

Eiweitfstoffe sind neben Fatten und Kohlenhydraten wichtige Bestandteile von Lebensmitteln. Nach 

enzymatischer Hydrolyse zu den Aminosauren im Verdauungstrakt fiefem sie die fur die Proteinbiosynthese 

notwendigen Bausteine. Nach emahrungsphysiologischen Gesichtspunkten werden sie in die - essentiellen 

Aminosauren: 
5 Vaiin (Val. V) 

Leucin (Leu, L) 

isoteucin (lie, I) 

Phenylalanin (Phe, F) 

Tryptophan (Trp, W) 
ro Methionin (Met, M) 

Threonin (Tiir, T) 

Lysin (Lys. K) 

- quasiesserrtiellen Aminosauren 
Histidin (His, H) 

is Arginin (Arg, B> und 

- nichtessentiellen Aminosauren 
Glycin (Gly. G) 

Alanin (Ala, A) 

Prolin (Pro. P) 
20 Serin (Ser, S) 

Cystein (Cys. C) 

Tyrosin (Tyr, Y) 

Asparagin (Asn. N) 

Gtutamin (Gin. Q) 
25 AsparaginsSure (Asp. D) 

GlutaminsSure (Glu, E) 

eingeteilt. In Klammern sind die im Fdigenden verwendelen Qblichen Dreibuchstaben-und Einbuchstaben- 
AbkUrzungen angegeben. 

Die biologische Wertigkeit elnes Proteins (g gebildetes K6rperprotein / 100 g Nahrungsprotein) wird 
30 durch den absoluten Gehalt an essentiellen Aminosauren bestimmt aber auch durch das MengenverhSltnis 
der essentiellen Aminosauren zueinander und zu den nicht-essentietlen Aminosauren (H.-D. Behtz. W. Gro- 
sch. Lehrbuch der Lebensmittelchemie, Springer Verlag. 1982). Die biologische Wertigkeit wird im allgemei- 
nen limitiert durch 

- Lysin : Defizit bei Getreideproteinen und anderen pflanzlichen Proteinen, 
3S - Methionin : Defizit bei Kuhmilch-und Fleischproteinen. 

- Threonin : Defizit bei Weizen und Roggen. 

- Tryptophan: Defizit bei Casein. Mais, Rels. ^ _ . ( 

Es gibt kein natOrliches Protein, das im Hinblick auf die biologische Wertigkeit optimal 1st Bn Gemisch 
aus 35 % Eiprotein und 65 % Kartoffelprotein nShert sich dem noch am wetesten an ("KartoffeJ-B-Muster". 

40 E. Kofranyi und E. Jekat (1964) in Hoppe-Seyler*s Z. physio!. Chem. 335, 174). Von der FAL/WHO wurde 
die optimal© Zusammensetzung eines Referenzproteins definiert (FAO-Nutrition Meetings Report Senes No. 
37 WHO Technical Report Series No. 301. Rome. 1965). Bn Protein mit hoher biologischer Wertigkeit. bei 
dem also die Aminosauren in den Mengen dem Organismus zugefOhrt werden. wie or sie fur den Aufbau 
kBrperelgener Proteine bendtigt sollte demzufolge nach pharmako-kinetischen Gesichtspunkten konzipiert 

46 sein. so dafi keine Imbalanzen (Oberschusse einiger Aminosauren. die Ober eine Belastung des Organismus 
entgiftet werden mOssen oder Defizite. die zur Vermtnderung der Proteinbiosynthese korpereigener Pro- 
teine Whren mOssen) auftreten kSnnen (F. Eckart, P.-U. Heuckenkamp und B. Weinhetmer, Gmndlagen und 
neue Aspekte der parenteralen und Sondenemahrung. in der Relhe INA des a Thieme Veriages. 1978. S. 
243. 259 ff.). Derartige Proteine waren daher von groflem physiologischen Wert, Jnsbesondere fUr Kranken- 

so hausdiSten (A. Weisch. KrankenernShrung, TOemeverlag, 1982). Bn Protein, das atleln die essentiellen und 
quasi-essentiellen Aminosauren enthSIt, hatte grofle Bedeutung fOr die Verbesserung der biologischen 
Wertigkeit natQriicher Proteine fOr die Ernfihrung von Tieren und Menschen. 

FUr bestimmte Krankheitsbilder wie z.B. der Leberinsuffizienz (z.B. bei Hepatitis. Leberzirrhose) ist der 
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Aminosaurestomvechsel gestort Dies fOhrt dazu, dafl im Blutplasma die aromatischen Aminosauren Phe, 
Tyr und Trp, sowie Met gegenuber normalen VerhaMtntssen erhoht, wShrend die verzweigtkettigen Ami- 
nosauren Leu. VaJ. He erniedrigt sind (F. Ch. Bode (1978), Internist 19, 72; E. Hoim. Behandlungen mit 
Aminosauren bei hepatischer Enzephaiopathie. Fischerverlag, 1976; J. Eckart. P.-U. Heuckenkamp und B. 

5 Weinheimer (1978), Thiemevertag, S. 285 ft). Hier 1st die richtige AminosSurezusammensetzung besonders 
wichtig. Eine unter normaJen Bedingungen optimale Amrnosdurezusammensetzung fUhrt hier zu einer Ver- 
schlechterung des Krankheitsbiides unter Zunahme hepatischer Enzephalopathien. Mit einer bedarfsadap- 
tierten Aminosaurezusammensetzung hingegen kann Leberinsufflzienz wirksam therapiert werden. Deratige 
Proteine mit einer in dleser speziellen Hinsicht optimalen Aminosaurezusammensetzung kommen in der 

ro Natur nicht vor. 

Bn anderer Fail, bei dem das Krankheitsbild entschetdend von der Aminosaurezusammensetzung dor 
in den Lebensmitteln vorhandenen Eweiflstoffe beeinfluflt wird, ist eine Form des Schwachsinns. der die 
Folge eines vererbten Stoffwechseldefektes ist: Phenyiketonurie (G.Q. Wendt. Vererbung und Erbkrankhel- 
ten (1974). Herder & Herder; H. Stengel: Humangenetik (1976), Quelle & Meyer). Durch eine Phenytaianin- 
15 freie DiSt, die allerdings von der Geburt an verabreicht werden muB, kann diese Erbkrankheit indlvidueil 
geheilt werden. Bn Protein, das aile notwendigen Aminosauren enthalt, aber frei von Phenyialanin ist, ist in 
der Natur unbekannt 

Um Aminos&urezusammensetzungen entsprechend dem FAO /WHOReferenzprotein Oder dem 
Kartoffe^i-Muster sowie zur Behandlung der Leber insuffizien2 und Phenyiketonurie bereitzusteilen sind 
20 bisher fotgende Wege beschritten worden: 



1) Verwendung von Aminosauregemischen: 

25 sie stehen fu*r alle drei erw§hnten Einsatzgebiete zur Verftlgung. Von groflem Nachteil sind: 

- die sehr unterschiedliche Loslichkeit einzelner AminosSuren , wobei Insbesondere die geringe Lasllchkeit 
von Cystein, Tryptophan. Tyrosin, Asparagin-und GlutaminsSure, Leucin und Phenyialanin Probleme berei- 
tet 

- der bittere Ceschmack 

30 - Empfindlichkeit beim Erhitzen (z.B. Sterilisieren). Eine Zersetzung fOhrt zX zu toxischen Substanzen und 
zur Herabsetzung der bfotogischen Wertigkert. 

- fOhrt bei oraJer Applikation zu Problemen 

- hone Osmolaritat setzt die dem Organismus zumutbaren Mengen stark herab. 

Die meisten der beschriebenen Nachteile wSren nicht mehr existent wenn die jeweils optimafen 
35 Aminosaurezusammensetzung in Form von Peptiden oder Proteinen vorlMgen. Hinzukommt das Peptide 
besser vom Darmtrakt resorbiert werden als die freien Aminosauren (S.A. Adibi und Y.S. Kim, Peptide 
Absorption and Hydrolysis (1981) Physiology of the Gastrointestinal Tract, edited by Leonard R. Johnson, 
Raven Press). 

40 

2) Chemische Peptidsynthese: 

Dieses Verfahren ist zu aufwendig und daher wirtschaftlich nicht zu vertreten. 

45 

3) Enzymatische VerMnderung von natUrfichen Proteinen. 

Hier ist insbesondere die Plasteinreaktion zu nennen. die durch das Zusammenwfrken vno mzymati- 
schen Hydroiysen und enzymatischen Peptidsynthesen das Verhaltnis der natu Ami- 
so nosaurezusammensetzung eines Proteins zu verSndem gestattet (H.D. Bel'rtz, W. Grosch (Mi jnrbuch 
der Lebensmittelchemie, S. 65 ff). Es wurde sowohl der Antell einiger essentielior AminosSurti i Aso et 
al. (1074) Tryptophan-, threonine-und lysine-enriched plasteins from Zeln, Agile. Biol.Chem, 38. 679) erhSht 
ais auch der AnteiJ von Phenyialanin fOr Phenylketonurie-Patienten erniedrigt (M. Yamashita et al. (1976), A 
low-phenyi-aJanlne, high-tyroslne plastein as an acceptable dietic food. J. Food Science AU 1029). Nachteil 
56 dieses Verfanrens ist der immer noch recht hone Aufwand und die Tatsache, da/3 undefinierte und schwer 
reproduzierbare Produkte entstehen. 

Der Erflndung liegt nun die Aufgabe zugrunde, auf einfache Weise molekuter etnheitliche Proteine mit 
genau fUr das entsprechende Bnsatzgebiet definierter Aminosaurezusammensetzung in hoher Reproduzier- 
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barkeit bereftzustellen. 

Die Losung dieser Aufgabe beruht auf dem Einsatz gentechnischer Methoden. 

Durch Gensynthese kann Uber den genetischen Code ein Protein-Gen synthetisiert werden, das Ober 
die definierte. codierte Aminosauresequenz nach Ublichen gentechnischen Methoden das gewQnschte 

5 Protein liefert _ „ m 

Dies gelang z.B. fur das Peptid Somatostatin (K. Itakura et al. (1977). Science 198. 1056) und filr ein 
artifizielles Gen. das fOr repiffiive Bnheiten der beiden AminosSuren (Asp-Phe)„ codiert (M.T. Doel et al. 
(1980). Nucleic Acids Res. 8. 4575 und DE-A-3 102721). Das zuletzt genannte Verfahren liefert ein Gemisch 
von Polypeptides bei denen n bis zu 150 betragen kann. Es konnte nach Polymerisation von zwei 

70 DodekanucleotWen, anschlleBender Integration des Gemisches der Ollgomeren in ein Plasmid und Transfor- 
mation von E. coli-Zellen nach Expression gewonnen werden. S.C. Gupta et al. (1983) benchten in 
Biotechnology, auf Seite 602 ff. Uber den Versuch durch ein selbstkomplementares Dodekanucleotid auf 
dem prinzipiell gleichen Weg ein Polypeptid herzustellen. das aus repetitiven Bnheiten der Aminosauren 
(Phe-Trp-Pro-Lys) besteht. Auch hier wQrde das Verfahren in der Lange uneinheitfiche Produkte liefern. 

18 Ihnen gelang die Polymerisation des 12-mers zu einem Doppelstrang von ca. 1000 Basenpaaren. Nach 
Integration in ein Plasmid konnten nach Klonierung, Jedoch - vermutiich aufgrund der unnatOrlich hohen 
Repetition von Palindromsequenzen - fUr das Tetrapeptid codierende DNA-Sequenzen nur bis zu 120 
Basenpaaren gefunden werden. Eine Expression. d.h. ein Nachweis. dafl das Tetrapeptid Oder ein Oligome- 
rs davon tatsSchnch von der E. coti-Zelle hergestellt wird. gelang ihnen nicht 

so Aufgrund des heutigen Kenntnisstandes ist auch der Expressionserfolg von Genen, die fUr artofzieile. 
d.h. nicht durch die Evolution optimierte Proteine codieren. nicht planbar (F. van Brunt (1986). Biotechno- 
logy, 277). 

Durch die im folgenden nSher erlauterten erfindungsgemaeen Verfahren erhait man hingegen erstmaiig 

definierte Proteine. die z.B. 
25 1) nur fur die essentiellen Aminosauren (p-A » Protein A). 

2) far ein phenylalanin-freies Protein mit ansonsten optimaler AminosSurezusammensetzung (p- 
AF~B) fOr die Behandlung der Phenylketonurie und 

3) fOr ein Protein mit optimaler Aminosaurezusammensetzung zur Behandlung der Leberinsuffizienz 
(p-AHB mit einem hohen Arrteil an verzweigtkettigen Aminosauren codieren. 

30 ' Derartige Proteine sind weder in der Natur bekannt noch bisher auf irgendeinem anderen moghchen 
Wege in wirtschaftlich vertretbarer Form herstellbar gewesen. Sie stellen daher votlig neue Proteine dar. 

Die erfindungsgemaflen artifiziellen Proteine mit unterschiedlichen Anwendungsgebieten werden durch 
gentechnische Methoden gewonnen. Die entsprechend codierten Amlnosauresequenzen wurden mit dem 
Genetischen Code In DNA-Sequenzen ubersetzt (B. Alberts et al., 1983. Molecular Biology of the Cell, 
as Garland Publishing. Inc.). Urn Flexibilitat auf dem DNA-Klonierungsniveau zu gewghrleisten und urn nach 
dem Baukastenprinzip verschiedene Proteine produzieren zu kSnnen. wurde eine Strategie gewahit. bei der 
austauschbare DNA-Kassetten fUr bestimmte Gruppen von AminosSuren codierten. 

Das Konzept von DNA-Kassetten. die nur fOr Proteine kodieren, die aus einer bestimmten Gruppe von 
AminosSuren bestehen. erlaubt Uber die Kassettenmutagenese und Oligomerisierung (s. welter unten) 
40 einzelner Kassetten eine Vietzahl von Kombinationsmoglichkeiten. 

Die Erfindung wird im folgenden anhand verschiedener Kassettentypen oder Kombinationen hiervon 

naher eriautert 

Kassette A codiert nur fOr die essentiellen. B nur fur die nlcht-essentiellen und H fOr die verzweigt- 
kettigen Aminosauren. Desweiteren wurde z.B. eine Kassette AF"" konzipiert die alle essentiellen Amt- 
46 nosSuren in gleicher molprozentualen Verteilung enthielten mrt Ausnahme von Phenylalanine Durch Kombi- 
nation dieser Kassetten waren die Strukturgene mit Codierung fOr folgende Proteine zugSnglich: 

1) Ein Protein, das nur aus essentiellen Aminosauren besteht (p-A), 

2) ein Protein (p-AB), das alle AminosSuren in emahrungsphysiotogisch optimaler Verteilung enthait. 

3) ein Protein (p-AF-B). das fUr die Behandlung von Phenylketonurie (PKU) geeignet ist da mit 
so Ausnahme von Phenylalanin; alle Aminosauren in physiologisch optimaler Verteilung vorliegen und 

4) ein Protein <p-AHB) mit einem hohen Anteil an den drei verzweigtkettigen Aminosauren Val. Leu. 
lie zur Behandlung von Leberinsuffizienzen. Die Zusammensetzung der vier Proteine zeigt Tabelle 1. 

Die Aminosaure Tyrosin zShit nicht Im engeren Sinne zu den fUr den Menschen essentiellen Ami- 
nosauren. Sie wurde aus praktischen GrQnden In das 5'-Ende der A-Kassette irrtegriert Die gezielte 

55 Entfemung des Codewortes fOr Tyr gellngt leicht auf dem Wege der Kassettenmutagenen. wie sp^ter am 
Beispiel der AF*"-Kassette gezeigt werden wird. 
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Tabelle 1 

Aminosaurezusammensetzung der artifizieiien Pro- 
teine p-A, p-AB, p-AF"B und p-AHB, angegeben 
als Aminosaurereste pro Molekul. 





p-A 


p - At> 


p- Rr o 


P- 


Isoleucin 


3 


3 


3 


7 


Leucin 


4 


4 


4 


9 


Valin 


3 


3 


3 


9 


Lysln 


2 


2 


2 


2 


Methionin 


1 


1 


1 


1 


Phenyl alanin 


1 


1 




1 


Threonin 


3 


3 


3 


3 


Tryptophan 


t 


1 


1 


1 


Tyrosi n 


1 


t 


1 


1 


Arginin 


2 


2 


2 


2 


Histidin 


2 


2 


2 


2 


Alanin 




10 


10 


10 


Asparaginsaure 




2 


2 


2 


Cystein 




1 


1 


1 


61 utami nsSure 




2 


2 


2 


Glycin 




4 


4 


4 


Prolin 




3 


3 


3 


Serin 




2 


2 


2 



FOr die Bestimmung der ernahrungsphysiotoglsch optimal en AminosSurezusammensetzungen wurde 
das FAO/WHO Referenzprotein. das KartoffehEi-Muster und verschiedene kommerzlell erhaWiche Ami- 
nosaurelosungen (z.B. Albumacid XP, Aponti PKU, Milupa PKU. Falkamin und Braun APL) zugrundegelegt. 
Asparagin und Glutamfn wurden nicht berGcksichtigt, da sie nicht essentiell sind. aus Asp bzw. Glu vom 
Organismus hergestellt werden kdnnen und ein zu grofler Anteil unter UmstSnden metabolische Problem© 
rnit stch bringen kann. 

Die einzelnen DNA Kassetten wurden nach dem "filling-in'-Konzept (F.F. Rossi et al. 1982, J. Biol. 
Chem. 257. 9220) mit dem Klenow-Enzym und unter Zugrundeiegung elner Oberiappungslange der 
einzelstrSngigen DNA-Fregmente von 12 Basenpaaren hergestellt Die einzelstrSngigen DNA- Fragments 
wurden nach der j^Cyanoethylphosp^oramJditmethode (H. Kfister et al. 1984, Nucleic Acids Res. 12. 4539) 
durch chemlschs Synthase dargesteltt RestriktionserkennungsstelJen wurden derart positiontert dafl die 
einzelnen Kassetten in definierter Weise miteinander unter Beibehaltung des Leserasters des Genetischen 
Codes kombiniert werden kflnnen. Das Code wort fOr z.B. Phenylalanln wurde am 5'-Ende der A-Kassette 
lokalisiert so dafl damit die Synthese des Gens fOr p-A und p-AF" mitelnander kombiniert werden konnte. 
(Entsprechendes gilt fUr das Codewort fUr Trp, Tyr.) 

Die drei Segmente fOr die A, B und H-Kassetten zeigt Flg.l, wobei die groflen Buchstaben die durch 
chemlsche, die kleinen Buchstaben die durch enzymatische Synthese eingebauten Bausteine (Nucleotide) 
reprSsentieren. Ober dem DNA-Doppelstrang (bp = Basenpaar) stent die codierte Aminosauresequenz im 
Bnbuchstaben-Code. Die entsprechenden Restriktionsendonuktease-Erkennungssequenzen sind in Blnde- 
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strichen mit den Qblichen AbkQrzungen vermerkt. Das Segment, das fUr p-AF~ codiert unterscheidet sich 
vorn A-Segment durch das Fehlen von Phenylalanin (F) am 5-Ertde des Duplexes. Die enzymatische 
Synthese der A-. B-und H-Kassette zeigt Rg.2. 

Im folgenden wird zunSchst eriautert. wie die synthetischen DNA-Kassetten zur Gewinnung expres- 

s sionsfShiger Vektoren gereinrgt und verrhehrt werden. Zu diesem Zweck wird die jewetlige Kassette oder 
Kassettenkombination in ein bekanntes Plasmld integriert und spater "in gereinigter Form" zur Integration in 
eines der erfindungsgemSfl benutzten Plasmide wieder ausgeschnitten. 

Die Klonierungsstrategie geht aus Rg. 3 hervor. Ein Dopperverdau des Plasmids pKK233-2 (E. Aman 
und J. Brosius (1985), Gene 40. 183) mit den Enzymen Ncol und HindHI eriaubte den Einbau der 

w entsprechend enzymatlsch behandeften Kassette A mit T4 Polynucleotidligase und fQhrte zum Piasmid 
pKK-A (bzw. pKK-AF~» wenn die Kassette AF" verwendet wurde). In der in Abb. 3 gezeigten Weise wurde 
nun schrittweise zunSchst Kassette B eingebaut Hierdurch werden die Strukturgene fOr die Proteine p-A. p- 
AB und pAF-B zugSnglich. Bnbau der Kassette H in das Plasmid PKK-AB lieferte das Strukturgen fOr das 
Protein p-AHB. Fig. 4 zeigt den Sequenzausschnitt des Plasmids pKK-AHB in der Integratiortsregion des 

75 AHB-Strukturgens. Die -35 und -10 Region des tac-Promoters und die Shine-Dalgarno-Sequenz (SD) 
-Ribosomenbindungsstelle -sowie Telle des rmB-Gens. sind verzeichnet. Die verwendeten Plasmide pKK-A. 
pKK-AB, pKK-AF-B und pKK-AHB wurden zum Klonieren der synthetischen Kassetten in E.coli GM33 
(dam*) bzw.. HB101 verwendet. Die korrekte Integration sowie die Rlcntigkeit der DNA-Sequenz wurden 
durch Sequenzierung nach Maxam und Gilbert bestimme (A.M. Maxam und W. Gilbert (1980). Methods in 

20 Enzym. 65, 444). 

Das Kassetten- Konzept erlaubt nicht nur die in Fig. 3 dargestellte Vorgehensweise, sondem ermSglicbt 
auch mit kieinen ErgSnzungen durch geeignete Linker-Sequenzen die Kassetten einzeln zu oligomerisieren 
und gegebenfalls nun zu komblnieren. Dies fUhrt 2ur Erhohung des Molekulargewichts des gewunschten 
Produktes und Ober einen "gene dosage effect" auch zur ErhQhung der Menge an hergestelltem Produkt 

25 pro Bakterienzelle. Hinzu kommt daJ3 kurze. fremde Proteine nicht selten in Mikroorganismen instabil sind. 
DarOberhinaus eroffnet die Kombination einzeiner ollgomerisierter Kassetten mit anderen Kassetten (vor und 
nach Oligomerisierung) die Einstellung anderer Aminosaurezusammensetzungen des codierten Proteins. Im 
folgenden sind einige Beispiete von Kassettenoligomerisierung und -mutagenese (s. weiter unten) gegeben: 
p-AaB, p-AaB. p-AeB. P-A12B 

00 0-AB2, p-ABo. pABs, p-ABt2 

p-AaHB. p-AcHB, p-AHBa. p-AHBc, 

p-AF-HB, p-AW-HB. p-AHB/AW-HB 

p-AW-HB/AHBC" 

p-AH 2 B. P-A2H2B. D-AH2B2 
35 und zur Vergrdflerung des Molekulargewichtes mit einhergehender Stabilisierung der Proteinstruktur: 

P-A2B2, p-A3B 3 , p-A$B€. p-At 2 Bt 2 
P-A2H2B2. p-A3H 3 B 3 . p-AsHsB^ 

Aligemein geschleht die Oligomerisierung von DNA-Sequenzen schrittweise. indem man 

A) die In ein Plasmid integrierte und zu oligomerisierende Fremd-DNA auf einer Seite am 3* -oder 5' -Ende 
40 (a oder b) schneidet (Stufe 1 von Fig- 7); an belde Enden der geoffneten Fremd-DNA AdaptermolekOle 

anUglert (Stufe 2 von Rg. 7), wobei die AdaptermolekOle die Spezrfitat der kohSsiven Enden der nicht 
gefiffneten Seite der Fremd-DNA ohne Mbgltehkeit zur Restaurierung der Restriktlonserkennungsstelie 
herstelien (Rg. 6), die Fremd-DNA am (anderen) 5-oder 3'-Ende (b oder a) schneidet (Stufe 3a in Rg. 7). 
und die noch vorhandenen 5-OH-Enden mit T4-Poiynucleotidkinase phosphoryliert; 
45 B) ein Aliquot zu der in das Plasmid integrierten und zu oligomerisierenden Fremd-DNA auf der anderen 
Seite schneidet (Stufe 3b von Rg. 7). und durch Behandeln mit AlkaJlscher Phosphatase Dephosphorylieit 

C) die betden Ansatze aus den Verfahrensstufen A) und B) miteinander vereinigt und mit Hilfe von DNA- 
Ugasen ligiert (Stufe 4 von Rg. 7); 

D) eine Kionierung durchfOhrt; 

so E) den Won m'rt der dublizlerten Fremd-DNA isoliert und 

F) gegebenenfails die Verfahrensstufen A) bis C) beliebig oftwiederholt oder 
nach DurchfUhrung der Verfahrensstufe A) 

B) die vom Plasmid befreite bzw. isoRerte Fremd-DNA in Gegenwart der entsprechenden Restriktionsen- 
zyme (mit entweder a-oder b-SpszifrtSt) durch T4.Polynucleotidligase figiert und gegebenenfails die Schritte 

55 A) und B) wiederttorfc 

C) die so erhaJtenen Oligomere in ein geeignetes Plasmid integriert und nach Transformation in geetgnete 
E. coli Stamme die oiigomerislerte Fremd-DNA kioniert 

Detailfierte Beispiele fOr den Bnsate mutagemsierter und/oder oiigomerisierter Kassetten vermittein Tabeilen 
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$5 Das Konzept ermSgticht natUrlich noch sine Vielzahi anderer Kombinationen unter ElnschluS auch der 
AF^, AW-etc. -Kassette, die wegen ihrer Offensichtiichkeit nicht waiter ausgefUhrt zu warden brauchen. 

Hierbel wird einschrMnkend zugmndegelegt. dafi einzelne Kassetten oder KassettenblScke maximal 12- 
mal verknOpft werden sollen und einzelne Kassetten durch Kassettenmutagenese in der oben angegebenen 
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Weise nicht mehr ats maxima} vier Codeworter verlieren solien. 

StelJvertretend fOr die oben erwShnton MBglichkeiten der Oligomerisierung wird dio der A-Kassette im 
Detail beschrieben. 

Die im Plasm id pKK-A integrierte DNA-Sequenz der A-Kassette zeigt Fig. 5. 

5 Das Startcodon ATG liegt in der Ncol-Sequenz, wa'hrend die Bcll-Sequenz sich kurz vor dem 

Stopcodon TGA befindet. Eine Oligomerisierung soil daher zweckmMJ3igeweise zwischen diesen Positionen 
erfolgen, wobei natOrlich das Leseraster der Proteinbiosynthese erhalten bleiben mud. Dies gelingt durch 
entsprechende Adapter-Molekule. wie sie Fig. 6 zeigt. Das Plasmid pKK-A wurde mit Bell geOfmet und die 
Bcll-Stelle durch zwei AdaptermolexQIe (unterstrichen) in eine Ncor-Stelle umgewandelt (Ncot*. da zwar 

io komplemerrtSre kohSsive Enden, entsprechend Ncol-Spezifita*t, jedoch wUrde Ligation nicht zur Rekonstitu- 
tion einer Ncol-Stelte fUhren: CCATGC anstelle von CCATGG; entsprechend wurde die BcllrStelle in bine 
Bcir-Stelte umgewandelt ). Dieses Konzept erlaubt zwei MSgiichkeiten. Zum einen kann sas Ncol / tool* - 
Fragment in Gegenwart des Enzyms Ncol in gezielter Weise oligomerisiert werden. Zum anderen kann das 
gleiche Fragment fur eine kontinuierliche Genduplikation verwendet werden (Fig. 7). Dies gelingt dadurch r 

15 da0 das mit Bell linearisierte Plasmid pKK-A mit den beiden Adaptermolekulen ligiert wird. Dies wird 
verdeutlicht durch die Schritte 1, 2 und 3a von Fig. 7. Die Bcll-Stelle wird dadurch in eine Ncol*-(und 
gieichzeitig auch die Bell in eine Bell") Stelle umgewandelt. Bn anderer Teil des Plasmids pKK-A wird mit 
Ncol llnearisiert (Schritt 3b in Fig. 7). Nun wird die Ncol-Stelle des ersten Plasmids (Schritt 3a) mit Ncol ge- 
schnitten und die Reaktionsprodukte nach Phosphorytierung der 5'-OH-Enden mit T4-Polynucleotldkinase 

20 mit dem dephosphorylierten Plasmid nach Schritt 3b (Fig. 7) verelnigt und einer Ligation mit T4- 
PolynucIeotidUgase unterworfen (Schritt 4 in Fig. 7). Die mdgllchen Reaktionsprodukte ergeben sich aus 
Rgur 7. Das Hnke Plasmid zeigt die gewfjnschte Verdoppelung der A-Kassette und konnte durch Klonierung 
in E. coli GM 33 (dam~) erhalten werden. 

Da das Dimere an der VerknUpfungsstelie der Monomeren weder eine Bcll-noch Ncol-Sequenz besitzt 

25 (Rg. 6) kann es zur Gewlnnung eines Trimeren, Hexameren etc. verwendet werden. Auf diesem Wege wird 
eine As-Kassette hergesteltt: 
A + A — A2 + A — A3+A3 — As 

Die jeweiligen Plasmtd-Konstruktlonen wurden in E.coli HB101 bzw. GM33 (erforderlich wenn mit Bell 
geschnitten werden soil, und dafUr eine unmethylierte Bcll-Stelle vorliegen mufl) kioniert. Die jeweilige 

30 Oligomerisierung konnte durch Behandlung der Plasmid-DNA mit Ncol / HindlH und Vergleich der emaite- 
nen BruchstQcke mit Langenmarker nachgewiesen werden. 

Die Expression der Proteine p-A, p-AB, p-AF""B. p-AHB wurde im Plasmid pGFY221N und pBK>52 
durchgefOhrt. pGFY221N wurde aus dem Vektor pGFY218L (K. Talmadge und W. Gilbert (1980), Gene 12, 
235) durch folgende Operationen erhalten: 

35 1) Verdauung mit PstL 

2) Entfernen der Oberstehenden 3'-Enden mit dem Klenow-Enzym. 

3) Ligation des Linkers d(AGCCATGGCT) an die stumpfen Enden des Plasmids. 

4) Verdauung mit Ncol und 

5) Ligation mit T4 Polynucleotidligase zum circulaVen Vektormclekul pGFY221N. 

40 Fig. 8 zeigt die Sequenz urn den interessierenden Klonierungsbereich und die Restrlktlonskarte des 
Plasmids pGFY221N. -Upstream" von der Klonierungsstelle befindet sich der tac-Promoter und 
"downstream* die rmB Terminatoren T1 und T2. 

Zur Integration der DNA-Kassetten A, AB und AHB wurden die Plasmide pKK-A. pKK-AB und pKK-AHB 
Jeweils einem Doppelverdau mit Ncol und HindlH urtterworfen P mit AlkaJischer Phosphatase dephosphoryHert 

45 und die Vektor-DNA mit Hinfl (das auf den DNA-Kassetten kelne Erkennungssequenz findet) abgebaut Die 
A-und AB-Kassetten wurden ohne weitere Aufreinlgung in den mit Ncol/Hindlll verdauten Vektor pGFY221N 
hineinligiert. Die AH8-Kassette wurde zunachst durch Gelelektrophorese an 5 % Polyacrylamid gerelnigt 
und dann in pGFY221N, wie oben beschraiben. integriert pGFY22lN/AF~B wurde durch posrn'onsspezifl- 
sche Mutagenese von pGFY221 N/AB erhalten. Dazu wurde pGFY221 N/AB mit Ncol/Kpnl verdaut (vergl. Rg. 

50 1) und danach ein 13-mer und 5-mer mit kohasiven Enden fOr Ncol und 
5' CATGGTTTGGTAC 
3'CAAAC 

Kpnl einligiert und damit das Codon fOr Phenylalanin entfemt. Dieses Verfahren der Entfernung des 
Codewortes fOr Phenylalanin ist ein Beispiel fUr das allgemein anwendbare Verfahren der "Kassetten- 
55 Mutagenese". Auf dem gleichen Wege kSnnen Kassetten erhalten werden. denen das Codewort fOr 
entweder Trp. Tyr, Cys Oder von anderen Amlnosduren fehlt. 

Damit liegen die Plasmide 
pGFY221N/A 
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pGFY221 N/AB 
pGFY221 N/AF~B und 
pGFY221 N/AHB vor. 

Die Richtigkeit der Sequenz der jeweiligen DNA-Kassetten und des Integrationsortes (sowie des 
' 5 Leserasters der Protetnbiosynthese) wurde durch DNA-Sequenzierung nach Max am und Gilbert bestStigt 
Rekombinante Proteine die vom Vektor pGFY221N codiert wurden. enthalten am N-terminalen Ende 
zusStzlich 6 AminosSuren (4 erttstammen der Penicillinase-Signafsequenz und 2 sind durch Urnwandlung 
der PstMn die Ncol-Stelle entstanden). Da hier ein Fusionsprotein entsteht. das Ober zusStzJlch 6 Ami- 
nosauren verfugt wurden andere Vektoren entwickelt die eine direkte Expression der in den jeweifigen 
io DNA-Kassetten codierten Protein Information bewirken sol Ken. 

Diese neuen Vektoren vom Typ pBI052 wurden aus den pGFY221 N- Vektoren entwickelt . 
Dazu wurden die Vektoren 
pGFY221N 
pGFY221 N/A 
75 pGFY221N/AB 
PGFY221N/AF-B 
pGFY221 N/AHB 

mit Ncol/EcoRf verdaut und damit ein 221 Basenpaare langes Fragment, das den ^Lactamase- Promoter 

und die Oberzahligen 6 N-terminaten Codons enthaft (s. Rg. 6 und 9K entfernt Die jeweifigen etwa 4.6 
20 Dalton groflen Plasmldfragmente wurden auf einem 1 % Agarosegel gereinigt und durch Ligation mit einem 

chemisch synthetisierten 52 Basenpaare langen Fragment das far die Translations-lnitiationsregion des 

E.coli atpE-Gens unter cyclisierenden Bedingungen mit T4 Polynucleotidligase ligiert 

Die Sequenz in der Kionierungsregion und die Restriktionskarte des neuen Plasmids pB1052 zeigt Rg. 

9. Damit standen die folgenden weiteren neuen Expressionsvektoren zur VerfUgung: 
25 pBI052 

pBI052/A 

pBI052/AB 

pBl052/AF~B 

pBI052/AHB 

30 Die DNA-Sequenz der jeweiligen DNA-Kassetten und die Richtigkeit des Integrationsortes wurden durch 
Maxam-GHbert DNA-Sequenzierung bestStigt Tabelle 4 zeigt die Molekulargewichte der von den 
pGFY221N-und pBK)52-Derivaten codierten artifiziellen Proteine. 
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TABELLE 4 



Artifizielles 
Protein 


Molekulargewicht der 
expremierten Proteine 
aus pBIO 52 


Molekulargewicht der 
expremierten Proteine 
aus pGFY 221 


p-A 


3338,3 D 


4048,1 D (1-A)* 


p-AB 


5764,8 D 


6474,6 D (1-A)* 


p-AF"B 


5599,6 D 


6309,4 D (1-AF'B)* 


p-AHB 


7648,8 D 


8358,6 D (1-AHB)* 


p-A 6 


20961 ,3 D 
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1- Leadersequenz aus 6 Aminosauren (Met-Ser-Ile-Gln-Ala- 
Ala), codiert "upstream" der einzigen Nco I Restriktions 
stelle in pGFY 221N. Dieses Leaderpeptid erhdht das 
Molekulargewicht jedes Fusionsproteins um 638,8 D. 
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Tab8lle 5 gibt eine Obersicht Uber die Proteinsequenzen der jeweiligen Proteine. 
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PROTEIN 



TABELLE 5 
AHI NOSHURESE.QUEMZ 





A 




MVFWYLV I KV IRLRLTHKHTL IT 


9 


1 


-A 


MSIQAA 


MVniYLV 1 KV IRLRLTHKHTL IT 






AF~B 




HV WYLV I KV I RLRLTHKHTLIT 


PGSAASADDAGPPGAEAAEAAGAC 


\ 


- AF~B 


KSIQAA 


MV KYLYIKVIRLRLTHKHTLIT 


PGSAASADDAGPPGAEAAEAAGAC 




AB 




MV FVJYLV I KV 1 RLRLTHKHTLIT 


PGSAASADDAGPPGAEAAEAAGAC 


1 


-AB 


MS1QAA 


MVFWYLV I KV I RLRLTHKKTLIT 


PG5AASADDA6PPGAEAAEAA6AC 




AHB 




MVFWYLV I KVI RLRLTHKHTLIT 


VVVVLLVIVLILILI PGSAASADDAGPPGAEAAEAAGAC 


1 


-AUB 


MSIQAA 


MVFWYLVIKV I RLRLTHKHTLIT 


VVVVLLVIVLILILI PGSAASA0DAGPPGAEAAEAA6AC 




A6 




MVFWYLV I KV I RLRLTHKHTLI 
MVFWYLV I KVI RLRLTHKHTLI 
KVFWYL V I KV I RLRLTHKHTLI 


LR MV FWYLVI KV I RLRLTHKHTL I LR 
LR KVFWYL VI KVI RLRLTHKHTL I LR 
LR MVFWYLV I KVI RLRLTHKHTL IT 
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fn beiden Tabellen, 4 und 5. sind ebenfalis Daten enthalten. die dem durch Oligomerisierung der A- 
Kassette gewonnenen Hexameren A« errtsprechen. 

Als weiteres Expressionssystem wurden Derivate des bekannten Plasmids pUR292 hergestellt (U. 
RQther und B. Muller-Hili (1983), EM BO Journal 2. 1791). mit denen ein Fusionsprotein zwischen dem 
gremen Tell der B-GalactoskJase und den artifizielle"n Protetnen A, AB, AF~B, AHB und A* erhalten werden, 
wobei zur Stabilisierung und Schutz vor Proteasen die artifiziellen Proteine am C-terminaJen Ende der 0- 
Galaktosidase posltioniert werden. Urn den erfindungsgemSfl geelgneten Vektor pUR30Q zu erhalten. wurde 
das Plasmid pUR292 mit BamW/Hindlll verdaut und durch Ligation von zwei chemisch synthetisierten 12- 
meren. die einen doppelstrSngigen Adapater mit kohfisiven BamHl-und Hind lll-Enden bilden. erne 
zusMtziiche Ncol-Stelle eingelOhrt Die Vektorkonstruktion mit der DNA-Sequenz an der Klonierungsstelle 
zeigt Rg. 10. 

Zur in-vitro Expression wurden die entsprechend durch UKrazentrifugation gereinigten Plasmids vom 
Typ pGFY221 N, pBI052 und pUR3C0 mit einem von der Fa. Amersham erhSltlichen Transkrlptfons- 
Translations-Systems In Gegenwart von entweder ^S-Methionin oder ^S-Cysteln expremiert und die 
Produkte auf einem 15 %igem SDS-Polyacrylamid-Gel durch Elektrophorese enalysiert Rg. 11 zeigt durch 
einen Vergleich mit Proteln-LSngenstandards. dafl die von den DNA-Kassetten codierten Proteine A. AB, 
AF~B und AHB in den joweiligen Plasmiden vom Typ pGFY221N und pB!052 in richtlger GrSBe exprirniert 
werden. Die IntensitMt der jeweingen Proteinbanden demonstriert auch die enorm hone in-vitro- Expression- 
seffizienz der artifiziellen Proteine. Da das B-Proteln am C-terminaJen Ende den einzigen Cysteln-Baustein 
enthSIt (s. Rg. 1), kann die lntaktheit der expremlerten Proteine, die das B-Protein am Oterminaten Ende 

enthalten. geprOft werden. . . 

Rg. 12 zeigt daB die Proteine p-AB. p-AF~B und p-AHB in Vektor pGFY221N und pBI052 in intakter 

Form expremiert werden. _ ^ 

Bcpresstonsversuch in vivo wurden im Minizell-System durchgefOhrt (Wirt E. Coli CMK 603). Fig. 13 
zeigt exemplarisch einige Ergebnisse. Es wlrd deutlich. daB die ExpressionsefftzJenz bzw. Stabilitat vom 
jeweiligen Vektor und dlerten Protein abhanglg ist. p-A wird mit dem Vektor P FGY221N. die Proteine p- 
AF-B und p-AHB mit dem Vektor pBI052 in signifikanten Aubeuten erhalten. 
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Es konnte durch 35 S-Cystein-Markierung gezeigt werden. dafl die Proteine p-AF~B und p-AHB auch in 
vivo in intakter Form, d.h. mit dem N-terminalen Methionin und dem C-terminalen Cy stein expremiert und 
von den E. coli-ZeNen produziert werden. Tabelle 6 gibt einen OberbNck Ober die gefundenen Proteinstabi- 
litaten im pB!052-und pGFY221 N-Vektor. 

TABELLE 6 



! Protein 
I 



TO 



I p-AB 

! 

! p-AHB 



! Stabilitat 

1 In Mi nizellen 
i - 



44 



Protei n 



1-A 

ua: 

l-AHB 



! Stabil:: it i 

I in Minizellen I 

! ! 

J 
t 

* 

! 
i 



44 
4 
4 



75 



44 vollstandis stabil 
4 teilveise stabil 
nicht stabil 

20 

Als weiters Beispiel fur die Expression der artifizieflen Proteine wurden die DNA-Kassetten fDr die 
Proteine p-AHB und p-A© im Vektor pUR300 expremiert Hier werden die Proteine im C-terminalen Bereich 
der 0-GaJaktosida$e anfusioniert AJs Wirt wurde der lac-Repressor Uberproduzierende E.coli-Stamm BMH 
71-18 verwendet. Durch IPTG kann die Expression des lac-Operons individuell induziert werden. Fig. 14 
25 zeigt die in-vitro Expression der Fusionsproteine nach Markierung mit ^S-Methionin. 

Man erkennt deutlich. da£ in sehr sauberer Reaktion entsprechend verlangerte Proteine expremiert und 
produziert werden. 

Fig. 15 zeigt die Produktion- der Fusionsproteine in-vivo im E.coli-Stamm BMH 71-18. Neben der 
Synthese anderer E.coli-Proteine 1st deutlich die Oberproduktion der gewOnschten Fusionsproteine zu 
30 erkv i - sn. Da die Synthese allein durch IPTG induzierbar 1st. handelt es sich eindeutig urn Produkte der lac- 
Ope .-^-Expression. Die Fusionsproteine konnten durch AffinitStschromatographie nach Ublichen Methoden 
gereintgt werden. 

Neben den detailliert beschriebenen Plasmiden pGFY221N, pBI052 und pUR300 eignen sich zur 
Integration der Kassetten A. AF~, B und H, von deren Mutageneseproduklen mit einer Reduktion von 

35 maxima) 4 Codewttrtern pro Kassette, von deren Oligomeren oder von deren Kombinationen, auch noch 
andere bekannte ExpressionsvektorAATirtssysteme. Die jeweiligen, geeigneten Expressionsvektoren k&nnen 
in den homologen Prokaryonten. z.B. die beschriebenen Bakterienstamme E.coli CMK 603, DS 410 im* 
BMH 71*18. und Eukaryonten, z.B. Hefen. einschliefilich Pflanzen transformiert werden. 

Experimenteile Beispiele sind oben fOr die Proteine p-A. p-AB, p-AF~B, p-A« und p-AHB im D*r 

40 schrieben word en. Hierbei wurde auf im allgemei nen bekannte Verfahren zurtlckgegriffen. Die chemise he 
Synthese der einzelstrgngigen DNA-Fragmente erfolgte nach Kdster et al. (1984). Nucleic Adds Res. 12, 
4539. DNA-Praparationen, Restriktions-und Ligation sversuche, radioaktives Markieren von DNA durch 
Klenow-Enzym. Agarose-und Polyacrylamidgelelektrophorese. Plasmidkonstruktionen, Transformatlonen von 
E.coll-Zellen, in vitro Expressions-Experimente und die Verwendung von E.coli-Minf-Zellen erfolgen nach 

45 Verfahren wie sie in der Literatur beschrieben sind. wie z.B. in T. Maniatis et ai. (1982) "Molecular Cloning: 
A Laboratory Manual". Cold Spring Harbor Laboratory, New York, and J. Brosius (1886) In "Vectors: A 
Summary of Molecular Cloning Vectors and Their Uses" (R.C. Rodriguez and D.T. Denhardt Herausgeber, 
Butterworth Publishers. Stoneham. Mass.. U.S.A.), sowie N.G. Stoker et al. (1884) In "Transcription and 
Translation. A practical approach", (B.D. Hannes und S.J Htggins. Herausgeber; IRL Press. Oxford, U.K.). 

50 Ferner J.H. Miller (1972) "Experiments in Molecular Genetics". Cold Spring Harbor Laboratory. New York. 
Die DNA-Sequenzierung erfolgte nach A.M. Maxam und W. Gilbert (1980). Methods Enzymol. 65, 499. 

Bei der Deutschen Sammlung von Mikroorganismen. Grfsebachstr. 8, D-3400 GSttingen, sind in 
Obereinstimmung mit dem Budapester Vertrag folgende erfindungsgemas benutzte Wlrt-Vektor-Systeme 
hinterlegt 

55 1 .) E. co(i CMK 603 enthaltend das Plasmid pGFY22i N mit Kassette A 

2. ) E. Coll CMK 603 enthaltend das Plasmid pBI052 mit Kassette AF~B 

3. ) E. coll CMK 603 enthaltend das Plasmid pBI052 mit Kassette AHB 

4. ) E. coli BMH 71-18 enthaltend das Plasmid pUR30O mit Kassette A* 
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AnsprOche 

t. Synthetische DNA-Kassette mit Codierung fOr ein artifizieUes Protein vorgegebener Ami- 
nosMurezusammensetzung 

2. DNA-Kassette A folgender Nucleotidsequenz: 

G GCCATG GTTTTCTGQTACCTGQTTATCAAAGTTATCCGTCTGCGTCTGACCCACAAACACAC 
CCGGTACCAAAAGACCATGGACCAATAGTTTCAATAGGCAGACGCAGACTGGGTGTTTGTGTG 

CCTGATCACCTGAAGCTTGG 
GGACTAGTG G ACTTCG AACC 

3. DNA-Kassette B folgender Nucleotidsequenz: 

CCCTG ATCACCCCGGGTTCC GCG GCTTCCG CAG ACG ACGCAGGTCCGCCGGGTGCTG AGGCAG 
GGGACTAGTGGGGCCCAAGGCGCCGAAGGCGTCTGCTGCGTCCAGGCGGCCCACX3ACTCCGTC 

CTGAGGCTGCAGGTGCATGCTGAAGCTTGG 
GACTCCGACGTCCACGTACGACTTCGAACC 

4. DNA-Kassette H folgender Nucleotidsequenz: 
GCCTGATCACCGTTGTTGTGGTTCTGCT6GTTATCGTGCTGATCCTGATGCTGATCCCGGGCCG 

CGGACTAGTGGCAACAAC ACCAAGACGACCAATAGC ACGACTAGGACTACGACTAG GGCCC GGC 

5. DNA-Kassette nach einem der AnsprOche 1 bis 4, dadurch gekennzeichnet dafl sie durch Anelnan- 
derkoppeln oligomerisiert ist wobel der Oiigomerisierungsgrad m 2 bis 12 ist. 

6. DNA-Kassette nach einem der AnsprOche 1 bis 5 in mutagenisierter Form mit einer Reduktion von 
maximal 4 CodewSrtern pro Kassette. 

7. Kombination der DNA-Kassetten A, 8 und H nach AnsprOchen 1. 2. 3, 4, 5 und/oder 6. 

8. Expressionsvektor. dadurch gekennzeichnet dafl er eine gegebenenfalls oligomerisierte und/oder 
mutagenisierte DNA-Kassette A nach einem der AnsprOche 2, 5 oder 6 enthalt. 

9. Expressionsvektor, dadurch gekennzeichnet da/5 er eine gegebenenfalls ongomerisierte und/oder 
mutagenisierte DNA-Kassette B nach einem der AnsprOche 3, 5 oder 6 enthSlt. 

10. Expressionsvektor. dadurch gekennzeichnet, dafl er eine gegebenenfalls oligomerisierte unoVoder 
mutagenisierte DNA-Kassette H nach einem der AnsprOche 4. 5 oder 6 enthalt 

11. Expressionsvektor, dadurch gekennzeichnet da/5 er eine Kombination von DNA-Kassetten nach 
Anspruch 7 enthalt 

1 2. Expressionsvektor nach Anspruch 8. dadurch gekennzeichnet, dafl er eine der f olgenden mutageni- 
sierten Kassetten A enthatt 

AF^ AW AY"~ AM"". 

13. Expressionsvektor nach Anspruch 11. dadurch gekennzeichnet dafl er eine Kombination folgender 
Kassetten enthalt: 

AB. AF-B. AW-B. AY~B. AM~B, ABC", AHB. AW~HB, AHBCT, AzB. AsB, A, 2 >B, AB 2 . AB 6 , AB, 2 , AHB* 
oder AHB/AW-HB. 

14. Expressionsvektor nach einem der AnsprOche 8 bis 13. dadurch gekennzeichnet. dafl er ein Plasmid 

ist 

15. Plasmid pGFY221 N 

16. Plasmid pBI052 

17. Plasmid pUR300 

18. Plasmid pGFY221N enthaltend eine gegebenenfalls oligomerisierte und/oder mutagenisierte DNA- 
Kassette nach einem der AnsprOche 2 bis 6 oder eine Kassetten-Kombination nach Anspruch 7. 

19. Plasmid pB1052 enthaltend eine gegebenenfalls oilgomerisierte und/oder mutagenisierte DNA- 
Kassette nach einem der AnsprOche 2 bis 6 Oder eine Kassettenkomblnatlon nach Anspruch 7. 

20. Plasmid pUR300 enthaltend eine gegebenenfalls oligomerisierte und/oder mutagenisierte DNA- 
Kassette nach einem der AnsprOche 2 bis 6 oder eine Kassetten-Kombination nach Anspruch 7. 

21. Plasmid pGFY221N enthaltend die DNA-Kassette A 

22. Plasmid pGFY221 N enthaltend die DNA-Kassetten AB 

23. Plasmid pGFY221 N enthaltend die DNA-Kassetten AF~B 

24. Plasmid pGFY221 N enthaltend die DNA-Kassetten AHB 

25. Plasmid pBI052 enthaltend die DNA-Kassette A 
28. Plasmid pBI052 enthaltend die DNA-Kassetten AB 

27. Plasmid pBI052 enthaltend die DNA-Kassetten AF~B 

28. Plasmid pBI052 enthaltend die DNA-Kassetten AHB 
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29. Plasmid pUR300 enthaltend die ONA-Kassetten AHB 

30. Plasmid pURdOO enthaltend die ofigomerisierte DNA-Kassette A* 

31. Wirt-Vektor-System, bestehend aus einem Pro-oder Eukaryonten einschlieltich einer Pflanze und 
einem transformierten Expressionsvektor nach einem der Anspruche 8 bis 30. 

5 32. E. coli CMK 603 enthaltend das Plasmid pGFY221N 

33. E. coli CMK 603 enthaltend das Plasmid pBI052 

34. E. coli CMK 603 enthaltend das Plasmid nach Anspruch 21 

35. E. coli CMK 603 enthaJtend das Pfasmid nach Anspruch 22 

36. E. coli CMK 603 enthaltend das Plasmid nach Anspruch 23 
io 37. E. coli CMK 603 enthaltend das Plasmid nach Anspruch 24 

38. E. coli CMK 603 enthaltend das Plasmid nach Anspruch 25 

39. E. coli CMK 603 enthaltend das Plasmid nach Anspruch 26 

40. E. coli CMK 603 enthaltend das Plasmid nach Anspruch 27 

41. E. coli CMK 603 enthaltend das Plasmid nach Anspruch 28 
rs 42. E. coli OS 410 enthaltend das Plasmid pGFY221N 

43. E. coli DS 41 0 enthaltend das Plasmid pBI052 

44. E. coli DS 410 enthaltend das Plasmid nach Anspruch 21 

45. EL coli DS 410 enthaltend das Plasmid nach Anspruch 22 

46. E. coli DS 410 enthaltend das Plasmid nach Anspruch 24 
20 47. E. coli DS 410 enthaltend das Plasmid nach Anspruch 25 

48. E. coll DS 410 enthaltend das Plasmid nach Anspruch 26 

49. E. coll OS 410 enthaltend das Plasmid nach Anspruch 27 

50. E. coll DS 410 enthaltend das Plasmid nach Anspruch 28 

51. E. coli BMH 71-18 enthaltend das Plasmid pUR300 

25 52. E. coli BMH 71-18 enthaltend das Plasmid nach Anspruch 29 

53. E. coli BMH 71-18 enthaltend das Plasmid nach Anspruch 30 

54. Artifizielles Protein, codiert durch eine DNA-Kassette nach einem der AnsprOche 1 bis 6 Oder eine 

Kassetten-Kombi nation gema'6 Anspruch 7. 

55. Artifizielles Protein nach Anspruch 54, codiert durch die DNA-Kassette A nach Anspruch 2, 
30 enthaJtend 13,0 Mol-% lie. 17.4 Mol-% Leu, 13.0 Mol-% VaJ, 8,7 Mol-% Lys, 4,3 Mol-% Met, 13,0 Mol-% 

Thr. 4,3 Mol-% Trp, 4,3 Mol-% Tyr, 8.7 Mol-% Arg und 8,7 Mol-% His. 

56. Artifizielles Protein nach Anspruch 54, codiert durch eine mutagenisierte DNA-Kassette nach 
Anspruch 6, ent haltend 13,6 Mol-% He. 18,2 Mol-% Leu. 13,6 Mol-% Val. 9.1 Mol-% Lys, 13.6 Mol-% Thr, 
9,1 Mol-% Arg und 9,1 Mol-% His sowie entweder jeweils 4,5 Mol-% Met, Trp und Tyr (Kassette AF~) Oder 

3$ jeweils 4.5 Mol-% Met, Phe und Tyr (Kassette AW~) Oder jeweils 4,5 Mol-% Met. Phe und Trp (Kassette 
AY") Oder jeweils 4,5 Mo»-% Phe, Trp und Tyr (Kassette AM - )- 

57. Artifizielles Protein nach Anspruch 54, codiert durch eine Kombination der DNA-Kassetten A und B 
(Kassette AB) nach Anspruch 7, enthaltend 6,4 Mol-% lie. 8.5 Mol-% Leu, 6,4 Mol-% VaJ, 4,3 Mol-% Lys. 

2.1 Mol-% Met, 2,1 Mol-% Phe. 6.4 Mol-% Thr, 2.1 Mol-% Trp. 2,1 Mol-% Tyr. 4,3 Mol-% Arg, 4,3 Moi-% 
40 His, 21 ,3 Mol-% Ala, 4,3 Mol-% Asp. 2,1 Mol-% Cys, 4.3 Mol-% Glu. 8,5 Mol-% Gly. 6.4 Mol-% Pro und 4,3 

Mol-% Set. 

58. Artifizielles Protein nach Anspruch 54, codiert durch eine Kombination einer mutagenisierten DNA- 
Kassette A mit der DNA-Kassette B nach Anspruch 7, enthaltend 6.5 Mol-% lie, 8.7 Mol-% Leu, 6.5 Mol-% 
VaJ. 4.3 Mol-% Lys, 6.5 Mol-% Thr, 4,3 Mol-% Arg und 4.3 Moi-% His und entweder Jeweils 2,2 Mol-% Met. 

45 Trp und Tyr (Kassetten-Kombination AF~B) Oder jeweils 2.2 Mol-% Met, Phe und Tyr (Kassetten- 
Kombination AW~B) oder jeweils 2,2 Mol-% Met, Phe und Trp (Kassetten-Kombination AY~B) Oder jeweils 

2.2 Mol-% Phe, Trp und Tyr (Kassetten-Kombination AM~B). 

59. Artifizielles Protein nach Anspruch 54, codiert durch eine Kombination der DNA-Kassette A mit einer 
mutagenisierten DNA-Kassette B (Kassette ABC") nach Anspruch 7, enthaJtend 6,5 Mol-% lie, 8,7 Mol-% 

w Leu. 6.5 Mol-% VaJ, 4.3 Mol-% Lys. 2,2 Mol-% Met. 2.2 Moi-% Phe. 6,5 Mol-% Thr. 2Z Mol-% Trp. 22 
Mol-% Tyr, 4.3 Mol-% Arg. 4,3 Mol-% His, 21.7 Mol-% Ala, 4,3 Mol-% Asp, 4,3 Mol-% Glu. 8,7 Moi-% Qly. 
6.5 Mol-% Pro und 4.3 Mol-% Ser. 

60. Artifizielles Protein nach Anspruch 57, codiert durch eine Kombination der DNA-Kassetten A, B und 
H nach Anspruch 7, enthaltend 11.3 Mol-% He. 14.5 Mol-% Leu, 14.5 Mol-% Val, 3,2 Mol-% Lys. 1.6 Mol-% 

55 Met, 1.6 Mol-% Phe. 4.8 Mol-% Thr. 1.6 Mc4-% Trp, 1,6 Mof-% Tyr. 3.2 Mol-% Arg, 3,2 Mol-% His. 16,1 
Mol-% Ala, 3,2 Mol-% Asp. 1.6 Mol-% Cys.3.2 Mol-% Glu, 6,5 Mol-% Gly. 4.8 Mol-% Pro und 3,2 Mol-% 
Ser. 
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61. Artifizielles Protein nach Anspruch 54, codiert durch eine Komblnation einer mutagenisierten DNA- 
Kassette A mrt den DNA-Kassetten B und H (Kassetten-Kombination AW~HB) nach Anspruch 7. enthaltend 
11,5 Mol-% He. 14,8 Mol-% Leu, 14.8 Mol-% Val. 3.3 Mol-% Lys. 1.6 Mol-% Met. 1.6 Mol-% Phe. 4.9 Mol- 
% Thr, 1.6 Mol-% Tyr, 3,3 Mol-% Arg. 3.3 Mol-% His, 16.4 Mol-% Ala. 3.3 Mol-% Asp. 1.6 Mol-% Cys. 3,3 

s Mol-% Glu, 6.6 Mol-% Gly. 4.9 MoJ-% Pro und 3,3 Mol-% Ser. 

62. Artifizielles Protein nach Anspruch 54, codiert durch eine Kombinatfon der DNA-Kassetten A und H 

mit einer mutagenisierten DNA-Kassette B (Kassetten-Kombination AHBCT) nach Anspruch 7, enthaltend 4 
11,5 Mol-% lie. 14,8 Mol-% Leu, 14.8 Mol-% Val, 3,3 Mol-% Lys. 1,8 Mol-% Met. 1,6 Mol-% Phe, 4,9 Mol- 
% Thf t 1.6 Mol-% Trp, 1,6 Mol-% Tyr, 33 Mol-% Arg. 3,3 Mol-% His, 16,4 Mol-% Ala, 3.3 Mol-% Asp. 3.3 
io Mol-% Glu. 6.6 Mol-% Gly. 4.9 Mol-% Pro und 3.3 Mol-% Ser. 

63. Artifizielles Protein nach Anspruch 54, codiert durch eine oligomerisierte (m = 6) DNA-Kassette A, 
das die in Anspruch 58 angegebene Aminosaurezusammensetzung aufweist und eln Molekulargewicht von 
20961, 3Dbesitzt 

64. Artifizielles Protein nach Anspruch 54, codiert durch eine Kombi nation oligomerisierter (m = 2. 6 
75 bzw. 12) DNA-Kassetten A mit der DNA-Kassette B nach Anspruch 7, enthaltend 8,6 Mol-% lie. 11,4 Mol-% 

Leu, 8.6 Mol-% Val, 5.8 Mol-% Lys. 2.8 Mol-% Met. 2.8 Mo)-% Phe. 8.6 Mol-% Thr. 2,8 Mol-% Trp, 2,8 
Mol-% Tyr. 5.8 Mol-% Arg, 5,8 Mol-% His. 14.3 Mol-% Ala. 2.9 Mol-% Asp. 1.4 Mol-% Cys, 2,9 Mol-% Glu, 
5.7 Mol-% Gly. 4.3 Mol-% Pro und 2.9 Mol-% Ser (Kassette A2B); 11.1 Mol-% He. 14.8 Mol-% Leu, 11.1 
Mol-% Val, 7,5 Mol-% Lys. 3.7 Mol-% Met 3,7 Mol-% Phe. 1 1 .1 Mol-% Thr. 3.7 Mol-% Trp. 3.7 Mol-% Tyr, 
20 7.5 Mol-% Arg. 7,5 Mol-% His, 6.2 Mol-% Ala. 1 2 Mol-% Asp, 0.6 Mol-% Cys. 1 ,2 Mol-% Glu. 2,5 Mol-% 
Gly, 1.9 Mol-% Pro und 1,2 Mol-% Ser (Kassette A«B) bzw. 12.0 Mol-% lie. 16.0 Mo!-% Leu, 12.0 Mol-% 
Val, 8,1 Mol-% Lys. 3.9 Mol-% Met. 3,9 Mol-% Phe, 12.0 Mol-% Thr. 3.9 Mol-% Trp. 3.9 Mol-% Tyr. 8.1 
Mol-% Arg. 8,1 Mol-% His, 3.3 Mol-% Ala, 3,7 Mol-% Asp. 0.3 Mol-% Cys, 0,7 Mol-% Glu. 1,3 Mol-% Gly. 

I, 0 Mol-% Pro und 0.7 Mol-% Ser {Kassette A12B). 

25 65. Artifizielles Protein nach Anspruch 54, codiert durch eine ^Combination der DNA-Kassette A mit einer 
oligomerisierten (m = 2. 6 bzw. 12) DNA-Kassette B nach Anspruch 7, enthaltend 4,2 Mol-% lie. 5.6 Mol-% 
Leu, 42 Mol-% Val. 2.8 Mol-% Lys, 1.4 Mol-% Met 1.4 Mol-% Phe. 4.2 Mol-% Thr, 1.4 Mol-% Trp, 1.4 
Mol-% Tyr, 2,8 Mol-% Arg. 2,8 MoJ-% His, 28.1 Mol-% Ala. 5.7 Mol-% Asp. 2,8 Moi-% Cys, 5.7 Mol-% Glu. 

II. 2 Mo4-% Gly. 8,5 Mol-% Pro und 5,7 Mo»-% Ser (Kassette A82): 1.8 Mol-% He. 2.4 Mol-% Leu. 1.8 Moi- 
30 % Val, 12 Mo^ Lys. 0.6 Mol-% Met 0.6 Mol-% Phe. 1.8 Mol-% Thr. 0,6 Mol-% Trp. 0.6 Mol-% Tyr, 1.2 

Mol-% Arg. 1 2 Mol-% His, 35.9 Mol-% Ala. 7,2 Mol-% Asp. 3,5 Mol-% Cys, 7.3 Mol-% Glu, 14.3 Mol-% 
Gly, 10.8 Mol-% Pro und 12 Mol-% Ser (Kassette ABe) bzw. 1.0 Mol-% He, 1.3 Mol-% Leu, 1.0 Mol-% Val, 
0,7 Mol-% Lys. 0.3 Mol-% Met 0.3 Mol-% Phe, 1,0 Mol-% Thr. 0,3 Mol-% Trp. 0,3 Moi-% Tyr. 0,7 Mol-% 
Arg. 0.7 Mol-% His. 38.5 Mol-% Ala, 7,8 Mol-% Asp, 3,8 Mol-% Cys. 7.8 Mol-% Glu, 15,4 Mol-% Gly. 11,6 
as Mol-% Pro und 7,8 Mol-% Ser (Kassette AB12). 

66. Artifizielles Protein nach Anspruch 54 codiert durch eine Komblnation der DNA-Kassetten A und H 
mit einer oligomerisierten (m = 2) DNA-Kassette B (Kassette AHB?) nach Anspruch 7, enthaltend 82 Mol- 
% lie. 10.5 Mol-% Leu. 82 Mol-% Val. 2.3 Mol-% Lys. 1.2 Mol-% Met. 1.2 Mol-% Phe. 3,5 Mol-% Thr. \2 
Mol-% Trp. 1 2 Mol-% Tyr. 2,3 Mol-% Arg. 2,3 Mol-% His, 233 Mol-% Ala, 4,6 Mol-% Asp, 2,3 Mol-% Cys. 

40 4,6 Mol-% Glu. 9,4 Mol-% Gly, 6,9 Mol-% Pro und 4,6 Mol-% Ser. 

67. Artizielles Protein nach Anspruch 54 codiert durch eine Komblnation der DNA-Kassetten A, H und B 
einerseits und eine Kombination elner mutagenisierten DNA-Kassette A mit den DNA-Kassetten B und H 
(Kassetten-Komblnation AHB/AVVHB) nach Anspruch 7, enthaltend 11.4 Mol-% He. 14,7 Mol-% Leu. 14,7 
Mol-% Val, 3,2 Mol-% Lys, 1.6 Mol-% Met 1,6 Mol-% Phe, 4.9 Mol-% Thr, 0,8 Mol-% Trp, 1.6 Mol-% Tyr. 

45 32 Mol-% Arg, 32 Mol-% His, 16,3 Mol-% Ala, 3,2 Mol-% Asp. 1.6 Mol-% Cys. 3,2 Mol-% Glu, 6.6 Mol-% 
Gly, 4,9 Mol-% Pro und 3.2 Mol-% Ser. 

68. Verfahren zur Herstellung von Proteinen nach einem der AnsprOche 54 bis 67 auf gentechnologi- 
schem Wege. dadurch gefcennzeichnet dafl man In an sich bekannter Weise mindestens eine synthetlsche 
DNA-Kassette nach Anspruch 1 mit Codierung fOr ein artifizielles Protein vorgegeberter Aminos- » 

so Surezusammensetzung synthetislert, in elnen zur Expression geeigneten Vektor Integriert diesen in einen 
geeigneten Wirt transformiert und dort unter geeigneten Bedingungen zur Expression bringt 

69. Verfahren nach Anspruch 68 zur Herstellung eines Proteins nach Anspruch 54, dadurch gekenn- 
zeichnet, dafi man in den Vektor eine DNA-Kassette nach einem der AnsprOche 2 bis 8 Oder eine 
Kassetten-Kombination nach Anspruch 7 integriert 

55 70. Verfahren nach Anspruch 68 zur Herstellung eines Proteins nach Anspruch 55, dadurch gekenn- 
zeichnet. da0 man in den Vektor eine DNA-Kassette A integriert 
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71. Verfahren nach Ansprucb 68 zur Her stel lung eines Proteins nach Anspruch 56, dadurch gekenn- 
zeichnet dafl man in den Vektor eine mutagenisierte DNA-Kassette A, namlich AF~ AW", AY" oder AM" 
integriert 

72. Verfahren nach Anspruch 68 zur Herstellung eines Proteins nach einem der AnsprOche 57 bis 67, 
s dadurch gekennzeichnet da/) man In den Vektor eine der folgenden Kassetten-Kombinationen AB. AF~B, 

AW"B, AY"B, AM"B. ABC". AHB. AW~HB, AHBC", A 2 B, AgB, A12B, AB2, AB*. AB, 2 , AHB 2 Oder 
AHB/AW""H3 integriert. 

73. Verfahren nach einem der AnsprOche 68 bis 72. dadurch gekennzetchnet. da£ man als zur 
Expression geeigneten Vektor ein Plasmid verwendet 

10 74. Verfahren nach Anspruch 73. dadurch gekennzetchnet da£ man ein Plasmid verwendet. das zu 
einer direkten Expression des durch die Kassette(n) codierten Proteins fOhrt 

75. Verfahren nach Anspruch 73. dadurch gekennzeichnet da/5 man ein Plasmid verwendet, das zur 
Expression eines Fusionsproteins aus Fremdprotein und durch die Kassette(n) codiertem Protein fQhrt. 

76. Verfahren nach einem der AnsprOche 68 bis 75, dadurch gekennzeichnet da/3 man als Wirt fUr den 
is transformierten Expressionsvektor einen Prokaryonten oder Eukaryonten einschliefllich einer Pflanze ver- 
wendet 

77. Verfahren nach Anspruch 76. dadurch gekennzeichnet, da£ man als Wirt einen E. coli-Stamm 
verwendet 

78. Verfahren nach Anspruch 77. dadurch gekennzeichnet. dafl man als E. coli-Stamm den Stamm E. 
20 coli CMK 603. HB 101, DS 410 oder BMH 71-18 verwendet 

79. Verfahren nach Anspruch 67, dadurch gekennzeichnet daJ3 man ein Wirt/Vektor-System gemafl 
einem der AnsprOche 35 bis 43. 46 bis 53. 55 oder 56 verwendet 

60. Verfahren zur schrittweisen Oligomerisierung von DNA-Sequenzen, dadurch gekennzeichnet da5 
man 

25 A) die in ein Plasmid integrierte und zu oligomerisierende Fremd-DNA auf einer Seite am 3 -oder 5'- 

Ende (a oder b) schneidet (Stufe 1 von Fig. 7); an beide Enden der gedffheten Fremd-DNA Adaptermo 
lekOle anligiert (Stufe 2 von Fig. 7), wobei die AdaptermolekOle die Spezrfrtat der kohSstven Enden der nicht 
geofmeten Seite der Fremd-DNA ohne Mdglichkeit zur Restaurierung der Restriktionserkennungssteile 
herstellen (Fig. 6). die Fremd-DNA am (anderen) 5'-oder 3'-Ende (b oder a) schneidet (Stufe 3a in Fig. 7), 

30 und die noch vorhandenen 5'-OH-Enden mlt T4-Polynucleotidkinase phosphoryliert; 

B) ein Aliquot zu der in das Plasmid integherten und zu oligorrierisierenden Fremd-DNA auf der 
anderen Seite schneidet (Stufe 3b von Fig. 7), und durch Behandeln mit Alkalischer Phosphatase 
dephosphoryliert 

C) die beiden AnsStze aus den Verfahrensstufen A) und B) miteinander vereinigt und mit Hilfe von 
35 DNA-Ligasen ligiert (Stufe 4 von Fig. 7); 

D) eine Klonierung durchfUhrt; 

E) den Klon mit der dubllzlerten Fremd-DNA isoiiert und 

F) gegebenenfalis die Verfahrensstufen A) bis C) bellebig oftwiederholt 

81. Verfahren zur schrittweisen Oligomerisierung von DNA-Sequenzen. dadurch geken"? rennet dafl 
40 man 

A) die in ein Plasmid integrierte und zu oligomerisierende Fremd-DNA auf einer Sett© ^p. 3'-oder 5'- 
Ende (a oder b) schneidet (Stufe 1 von Rg. 7); an beide Enden der getfffneten Fremd-DNA Adaptermo- 
lekOle anligiert (Stufe 2 von Fig. 7), wobei die AdaptermolekOle die SpezifitSt der kohSsiven Enden der nicht 
geSffneten Seite der Fremd-DNA ohne MSglichkeU zur Restaurierung der Restriktionserkennungssteile 

45 herstellen (Fig. 6), die Fremd-DNA am (anderen) 5'-oder 3 -Ende (b Oder a) schneidet (Stufe 3a in Rg. 7), 
und die noch vorhandenen 5-OH-Enden mit T4-Po!ynucfeotidkinase phosphoryliert, und 

B) die vom Plasmid befreite bzw. isotierte Fremd-DNA in G eg en wart der entsprechenden Restriktion- 
senzyme (mit entweder a-oder b-Spezffitat) durch T4-Poly nucleoid I igase ligiert und gegebenenfalis die 
Schritte A) und B) wiederholt; 

so C) die so erhartenen Ollgomere in ein geefgnetes Plasmid integriert und nach Transformation in 

geeignete E. coli StSmme die oilgomerisierte Fremd-DNA kloniert 
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P 

Bit A (83 bp) 



HUH r L V I K V IRIRL THKHTL I T 
GGOCATQSl 1 1 ICISGT/CCresnATCAAflGnWgS^ 

coggtaccaaaagaccatggaccaatagtttcaataBSCAS^MSCraBS^ 1 ISTE3 UjaflCTAGTGGCTTCGAACC 
-ttoU -Kjpnl- -8:11- -HindS- 

SegiEfit B (93 bp) 

L I TPGSAASADDAGPP6AEAAEAAGAC* 

ccCTGncmcsQsnccecQQcnccs^^ 

gggactagtggggcnaaggcgccgMggq^^ 

-ft: IV -»ib1- -Sac2- -Pvi£- -Pstl- -Sph% -ttnd3- 

lent H (64 bp) 



LITVVVVLLVIVLILILIPG 

GCCTGSJCAUJbl 1U IblUbl ILI(dL>(dbriATCGTGctgstalg»gctgatcccgggocg 
cggactagtggc«caacaccaagacGttW^^ 

-BC11- -*tb1- 



Fig. 1 DNA-Seouenzen der DNA-Kassetten fQr die Protelne p-A, p-B 

und p-h durch kombinierte chemische/enzymatlsche DNA-Synthese 
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Fig* 2: 



"In vitro" syrithese der d o ppe 1 st r Sng i gen 

Fragmente A, B und H unter Verwendung des Klenow 
Fragments der E.coli Polymerase I. 

a) Bi ldungsgeschwl ndlgkeit des voll ausgebi Ideten 
doppelstrang tgen Segments A: Oligomer A-1 (49-mer), 
Bahn 1; Oligomer A-2 (46-raer) Bahn 2; Homo-01 igo-dT 
Ldsungsstandard; Bahn 3; Reaktionsgemisch vor der 
Enzymzugabe, Bahn 4; Reaktionsgemisch 1,5; 2,5; 5; 15 
und 30 Minuten nach der Enzymzugabe, Bahnen 5» 6, 7, 8 
und 9. 

b) Enzymatische Synthese des Segments B: Oligomer B-2 
(52-mer). Bahn 1; Oligomer B-1 (53-mer). Bahn 2; 
Reaktionsgemisch 45 Hin. nach dem Reakt ionsanfang 
(25°C), Bahn 3. 

c) Enzymatische Synthese des Segments H: Mlschung der 
Oligomere H1 und H2 (38-mere) vor der enzymati schen 
Reaktion* Bahn 1; Reaktionsgemisch nach 30 Min. 
Reaktion, (25°C) 9 Bahn 2. 

Polyacrylamid-Oelelektrophorese in 7M Harnstoff (a), 
(b): 8 % Acrylamid und (c) 5 % Acrylamid. 



12 3456 789 



1 2 




-93 



64- 



83- 



49- % 




-53 

—52 38- 





0 285 675 



Bam HI 
EcoRI 




A1 U9-mef) 



Ncol 



3* 12 bp A2M6-mer) 5' 

ONA polymerase I (Klenow) 
Bell HindM 

S3: 



Pvul 



A segment (83 bp) 

Hind m 
A/co I 



Ncol 

SO 

ACATTTXaaCAO ACCiATOJOCTOC AOCCA'AOCTTOOC 

tgtcctttgtc t GCfr acjc cac g t cggt t c GA AC C G 



vcoi rati rimajtt 
(TcJaToIo c t a cL o c c a!a g c tt 



Bam HI 
EcoRI 



BamHI 
EcoRI 



Hind M 
Ncol 



PvuE 




Pvul 



Bet I 
HindM 



Pvul 



Bell 
Xmal 



Bl < 53- mer) 



3' 12 bp B2(52-mer) 5* 

♦ 

ONA polymerase I (Ktenow) 



Bell Xmal 

S3= 




B segment (93 bp) 

Bail 
HindM 



3 # 



mini 



3' 12 bp H2t38-rner) 5* 
ONA polymerase I (Klenow) 

Xmal 

5 



H segment (62 bp) * 

Bcil 
Xmal 



PvuE 



on 



pKK-AHB 



BamHI' 
Eco RI- 



v Ncol HindM 

A* rc /Bell \ 
\S/ jXmal^ 



ampj 



Pvul 



Fig. 3. Strategie der Klonierung der synthetlschen DNA-Kassetten in den 
pKK233-2 Vektor. 
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Kloniertes ' AHB'-Gen (194 BP) 

-?? '_ -SD- m Val Phe 

TTC 

- WDOl - 

Trp Tyr leu Ya! He lys \fel He trg leu Arg leu Thr His lys His Thr Leu lie Thr Val Val Val 
TffiTACGBGnArCAWGrTArcan"CTGa^CTG/CC(^AAACAC/CCCTGArc 

- Btn - 

tel leu leu Val lie Val leu lie leu He leu He Pro Sly Ser Ala Ala Ser Ala Asp Asp Ala Gly 

GTTCrGCreGnATCGn3CTGATCCTGATCCTGArC(rGQBCTDCflD6CTTCCQCASV6V0CAQ^ 

- Xnal - 

Pro Pro 61y Ala Glu Ala Ala Glu Ala Ala 61y Ala Cys *** rm B (posn. 6416, ref. #66 ) 

CCG CCG GST GCT GOG GOV OCT GOG 6CT 6C4 GST GCA TGC TGA A9CTTGGC TGTTTGGCG G 

-Hind3- 



Fig. 4 DNA-Sequenz der AHB-Kassette 1m Plasmld pKK-AHB. 
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Itet Val Hie Trp Tyr Leu 14 Codons leu ne Ihr STOP 
5" — C CATSSTTTTCT66TACCTG CT6ATCACCT6AAGCTT — 3» 

3*— G6TACCAAAA6ACCAT66A C S A C T A 6 T 6 6 A C T T C 6 A A — 5* 

— Nool — -Kpnl — -Bell —Hindi 1 1— 



Fig. 5. Restriktionsstellen der DNA-A-Kassette in pfCK-A 
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lie Leu Arg Met 

5' — T 6A.TCCTSC6 3' 

3' — A C T A 6 6 AC6C 6T AG-^ f 5 T 
—Bell* — -£tol*~ 



Fig, 6. Umwandlung der Bel I -S telle durch zwei chemlsch synthetisierte 
.Nonamere (unterstrichen) als Adaptoren. Auf diese Weise wird 
die Bcll-Stelle 1n e1ne Bc1I*-Stelle umgewandelt und ein 
kohSsives Ende Fur Ncol gebildet, das nach Ligation m1t einera 
dazu passenden Ncol-Ende zu einer Ncol -Stelle fUhrt, 
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a b 

Fig- 7. Schema zur Verdeutlichung der Duplikationsstrategie der erfindungs- 
gemaBen DNA-Kassetteru 
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PvuQ 




BamH 



Pvut 



\ 




DamU T 

GGATCCGGA6CnATC6ACTGCAC66TGCACCAATGCTTCT66C8TCAGGCAGCCATCSGAAGCTSTSGTATS6CT 

GTSCAGGTCGTAAATCACT6CATAATTCSTGTCSCTCAAG6CGCACTCCCSTTCTG6ATAAT61 1 1 1 1 1GC6CCGA 

-35 -10 Ptac 

CATCATAACGGnCTGGCAAATAnCT6AMTGA6CT6TTSACAATTMTCATCG6CTC6^ 

ldc ODSFfl^or Eco RI 

CT(^{y,E^TAACAATTTCACACAGGAMCAGMTTCTTGM6AC6AMGG6CCTC6T6ATACGCCTATTTTTATA 

' Aai II „ 

GGTTAAT GTCAT GATAAT AATSGT TTCTTA GAC6TCC GGT GGC ACTTTTC GGGGAAATGT GC GCG6AAC CC CT ATT 

-35 -10 Pbla 

T6TTTATTTnCTAMTACATTCAAATATCT 

SD start Nco I Hind III 

GAA AAAGGM GAGTAT6AGTATTCMGCA 6CCAT66C T6C CAAGCTTG GCTGTTTrGGCGGATCA6A6MTATTTT 

CAGCCTGATACAGATTAAATCAGMCGCAGMGCGGTCTGATAAAACA6MTTT6CCTGGC6GCAGTAGCGCGGTG 

55 rRNA 

GTCCCACCTGACCCCATGCCGAACTCAGAAGTGAAACGCCGTA6CGCCGATG6TA6TGTG66GTCTCCCCATGCGA 

T1 

GAGTAGGGMCTGCCAGTCATCA MTAAAACSAM 

TGTCGGT6AACGCTCTCCTGAGTAGGACAMTCCGCCGGGAGCG6ATTTGMCGTTGCGAAGCAACS6CCC6GAGG 

T2 • 

CT<^RRty.AR(^CGCCCC£CATAAACT6CCA6GCATCAAATTM 
6CGTTTCTACAAACTCTT 



Fig. 8 pGFY221N Restriktionskarte und DNA-Sequenz in Bereich der 

Klonierungsposition (Ncol/Hindlll) des Vektors pGFY221N. 
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Pvull 




Sall- 



Pvul 




BamHI 

66ATCC6 6A6 CTTATCSACT GCACGST6CA CCAAT6CTTC TGGCGTCAGG CAGCCATCGG AAGCT6TGGT 

AT6SCT6TGC ASSTC6TAAA TCACTGCATA ATTCGTSTCS CTCAAS6CGC ACTCCC6TTC T66ATAAT6T 

-35 

TTTTTSCSCC 6ACATCATAA C6GTTCTSGC AAATATTCTS AAAT6AGCT6 TTSACAATTA ATCATCSSCT 

-10 Ptac EcoRI 
C6TATAATST 6TGGAATTGT 6AGCGGATM CAATTTCACA CAGGAAACA 6 AATTCTAATT ACCAACACTA 

SO . Ncol Hindi II 

CTACGTTTT A ACT6AAACAA ACTGGA6ACT GCCATGGCTG CCAAGCTTGG CTGTTTTGGC GGATCAGAGA 



AGATTTTCA6 CCTGATACAG ATTAAATCAG AACGCAGAAG CGGTCTGATA AAACAGAATT TGCCT6GCGG 

CAGTAGCGC6 GTGGTCCCAC CT6ACCCCAT GCCGAACTCA 6AAGTGAAAC GCCGTAGCGC C6AT66TAGT 

T1 

GT6GGGTCTC CCCAT6CGAG A6TAGGGAAC TGCCAGGCAT CAAATAAAAC GAAAGGCTCA GTCGAAAGAC 
TGGGCCTTTC 6TTTTATCTG TT6TTT6TCG 6TGAACGCTC TCCTGA6TAG GACAAATCCG CCGGGAGCG6 

ATTTGAACGT T6CGAAGCAA C6GCCC66AG GGT6GCG6GC AGGACGCCC6 CCATAAACT6 CCAGGCATCA 

T2 

AATTAAGCAG AAGGCCATCC T6ACGGATG6 CCTTTTTGC6 TTTCTACAAA CTCTT 



F1g. 9 pBI052 Restrlktlonskarte und DNA-Sequen2 iro Bereich der Klorilerungs- 

position (Ncol/Hindlll) des Vektors pBI052. 
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BamHJ McoJ Hind Iff 




Fig. 10. Plasmid pUR300, raodifizierter Vektor pURZ92, nach Insertion 

einer neuen elnzlgen Ncol Res trlktlonss tell e. Die DNA-Sequenz 
an der Klonierungsstelle 1st herausgeschrieben. 
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Fig. 11: Expression der fQr die a rt i f i z i e 1 len Proteine 

codierenden Gene, kloniert in den Vektoren p6FY221K 
und pBI052, in einen "in vitro" Transkript ions- 
Translation -System. Autoradiographic der 
Elektrophorese ( 35 S)-Methionin aarkierter Polypeptide 
(15 Xiges Polyacrylamid-S0S-6el). 

Bahn 1: "In vitro" Transkriptions-Translation-System 
mit ( 35 S)-Met ergSnzt. ohne ON A; 
2: pBI052; 3: p6FY22lN; 4: pBI052/A; 5: 
P6FY221N/A 

6: pBI052/AB; 7: p6FY221N/AB; 6: pBI052/AF - B; 9: 
pBFY21 1N/AF"8; 

10: pBI052/AHB; 11: p6FY221N/AHB; H : 
Molekulargewicht-Standards 



A % I H 5 * * * 5 40 44 M 
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Fig. 12: Beweis der Vollstandigkeit der Am inosSuresequenzen 

artifizieller Proteine. Die Polypeptide wurden unter 
Verwendung der Vektoren pBI052 und pgfY221N in 
Gegenwart von ( 35 S) -Methionin oder ( 35 S) -Cy stein in 
einem "in vitro" Transkriptions-Translation-System 
exprimiert. 

A : Bahn 1: pBI052 ( 35 S) Met-markiert; Bahn 2: pBI052 ( 35 S) 
Cys-markiert; Bahn 3: pBI052/AB ( 35 S) Met-markiert; Bahn 4: 
PBI052/AB ( 35 ) Cys-markiert; Bahn 5: pBI052/AF'B ( 3S ) Het- 
markiert; Bahn 6: pBI052/AF"B ( 35 S) Cys-markiert; Bahn 7 
PBI052/AHB ( 35 S) Het-oarkiert ; Bahn 8: pBI052/AHB ( 35 S) 
Cys-markiert* 

B : Bahn 1: p6FY221N ( 35 S) Met-markiert; Bahn 2: p6FY22tN/AB 
( 35 S) Met-markiert; Bahn 3: p6FY221N/AB ( 35 S) Cys-markiert; 
Bahn 4: p6FY22 1M/AF'B( 35 S) Met-markiert; Bahn 5: 
P6FY221 N/AF~B ( 35 S) Cy s-marklert ; M: 0 4 C) -marki er te 
Ho 1 eku 1 arge w i chtst andards. Autoradiographic der 
Elektrophorese auf dem 15 Xigen SOS-Polyacrylamidgel. 



A. H^l^ifSitS 



B. M A % I H 5 





AtHCO '■ m 




"booo 
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Fig. 13: Vergleich der Translationsprodukte "in vitro" und "in 

vivo" von entsprechenden 6enen unter Veruendung der 
Vektoren pBl052 (A) und P6FY221N (B). Die ungeraden 
Bahnen enthalten ( 35 S) Methioni n-raarkierte Produkte 
der "in vitro" Transkriptions-f ranslation und die 
geraden Bahnen enthalten die Proteine vom Mini-Zellen- 
Systera nach der ( 35 S) Methionin-Markierung. 

Bahnen 1 und 2: p6FY221N; Bahnen 3 und 4: p6FY221N/A; 
Bahnen 5 und 6: p6FY221N/AB; Bahnen 7 und 8: 
p6FY221 N/AHB; Bahnen 9 und 10: pBI052; Bahnen 11 und 
12: pBI052/A; Bahnen 13 und 14: pBI052/AB; Bahnen 15 
und 16: pBI052/AF"B; Bahnen 17 und 18: pB1052/AHB. 
M: ( 14 C)-markierte Molekulargewicht-Standards. 

Autoradiographie der Elektrophorese ( 3S S)-Hethionin- 
markierter Polypeptide (T5 tiges Polyacrylan id-SDS- 
6el). 



■ 

3 H S" 6 > * M 3 »• i» « » w i* t« i> it 




■ in rl j-.it*ri\" - - • " r > i " — t - vJy - 
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- Fig. 14: Protein-Expression im "in vitro" Transkript ions- 

TransUtion-System unter Verwendung der Vektoren 
pUR300, pUR300/AHB und pUR300/A6, Bahnen 1,2 und 3. 
35 S-Methionin-marlcierte Proteine wurden auf deni 
15 Xigen SDS-Polyacrylamid-Gel analysiert. 



i Z 3 
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Fig. 15: Expression der B-Ga i actos idase (B-6ai) und der 

Fusionsproteine B-Ga 1- AH B und fi-6al-A6 im E.coli Stamm 
BNH 71-18, unter Verwendung der Vektoren pUR300, 
PUR300/AHB und pUR300/A6. 

Bahn 1: gereinigte B-6al aktos idase (Sigma) als 
Molekulargewicht-Standard; Bahnen 2 und 3: pUR300 ohne 
und nach der IPT6 Induktion; Bahnen 4 und 5; 
pUR300/AHB ohne und nach der IPT6 Induktion; Bahnen 6 
und 7: pUR300/A6 ohne und nach der IPT6 Induktion* 

Die Proben wurden auf den 7,5 %lgen SOS- 
Polyacrylamldgel analysiert. 



A X 3 H S C * 
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